• • 下一篇
王海涵1,朱焱1
摘要: 互联网上散布的攻击性言论严重扰乱了正常网络秩序,破坏了健康交流的网络环境。现有的检测技术更专注于文本中的鲜明特征,难以发现更加隐晦的攻击方式。针对上述问题,提出了融合反讽机制的攻击性言论检测模型BSWD (BERT-based Sarcasm and Word Detection)。首先,提出基于反讽机制的模型Sarcasm-BERT,以检测言论中的语义冲突;其次,提出细粒度词汇攻击性特征提取模型WordsDetect,检测言论中的攻击性词汇;最后,融合两种模型得到BSWD模型,提高检测精度。实验结果表明,与BERT(Bidirectional Encoder Representation from Transformers)、HateBERT模型相比,所提模型的准确率、精确率、召回率和F1分数指标普遍提升2%以上,显著提高了检测性能,更能发现隐含的攻击性言论;同时,与SKS(Sentiment Knowledge Sharing)、BiCHAT(Bidirectional Long Short-Term Memory BiLSTM with deep Convolution neural networkCNN and Hierarchical ATtention)模型相比,具有更强的泛化能力和鲁棒性。消融实验结果表明,与WordsDetect、Sarcasm-BERT相比,所提模型的精确率、召回率和F1分数指标都有0.5%~1.5%的提升,成功集成了每部分工作的优势能力。
中图分类号: